ReferencePipeline

用于描述中间管道阶段或者管道源阶段的抽象基类。

继承 AbstractPipeline，实现 Stream

AbstractPipeline

继承 PipelineHelper，实现 BaseStream

文档说明

管道类的抽象父类，是 Stream 接口及其原生特化的核心实现。它会管理流管道的构建及评估
AbstractPipeline 代表一个流管道的的初始部分，它封装了流的源，以及一个或多个中间操作
- 每个 AbstractPipeline 对象通常被称为 stage(阶段)，每个阶段描述的，要么是流的源，要么是一个中间操作
一个具体的中间阶段通常通过一个 AbstractPipeline 构建，一个 “类型特化(shape-specific)管道” 继承它(如：IntPipeline)后仍旧抽象，再由一个“操作特化(operation-specific)”的具体类去继承前者
AbstractPipeline 包含了大多数评价管道的机制，并且实现方法，这些实现的方法都会被操作使用到；“类型特化”的类会添加一些辅助方法，用于将结果集装到合适的“类型特化”的容器当中（也就是避免装箱拆箱的操作）
在链接一个新的中间操作，或者执行一个终止操作后，这个流就会被标记为已消费，并且不会再有更多的中间或终止操作添加到这个流实例当中
implNote
对于串行流，以及所有中间操作都无状态的的并行流两种情况，管道的计算是在单个的过程中完成的，所谓的单个的过程就是，将所有的操作都放到一起完成
对于有状态操作的并行流，执行会被分为多个“段”，当中每个有状态的操作都会在段的结尾打上标识，然后每个段都会单独地进行计算，并且每段的输出结果都会作为下一段的输入
在所有的情况中，在一个终止操作开始之前，源数据都不会被消费

属性

previousStage
- 上游的 pipeline，源阶段置 null
sourceStage
- 指向管道头的反指向链，源阶段为自身
sourceOrOpFlags
combinedFlags
depth
- 当前管道对象与流的源(串行)或前状态(并行)之间，中间操作的个数
- 在管道准备进行计算的时间点有效
parallel
- 是否并行，只在流的源阶段有效
sourceSpliterator
- 源的 spliteraror，只在管道头有效
- 在管道被消费前，若为“非空”，则 sourceSupplier 必须为 null
- 在管道被消费后，若为“非空”，则将其置 null
sourceSupplier
- 源的 supplier，只在管道头有效
- 在管道被消费前，若为“非空”，则 sourceSpliterator 必须为 null
- 在管道被消费后，若为“非空”，则将其置 null

构造方法

构造方法一：构造流管道的头

上游 pipeline 置 null，将带有数据源引用的 spliterator 赋给当前 pipeline，

将当前阶段标记为源阶段，配置操作属性，当前深度初始化为0，设置串行/并行标记

AbstractPipeline(Supplier<? extends Spliterator<?>> source,
                     int sourceFlags, boolean parallel) {
    this.previousStage = null;
    this.sourceSupplier = source;
    this.sourceStage = this;
    this.sourceOrOpFlags = sourceFlags & StreamOpFlag.STREAM_MASK;
    // The following is an optimization of:
    // StreamOpFlag.combineOpFlags(sourceOrOpFlags, StreamOpFlag.INITIAL_OPS_VALUE);
    this.combinedFlags = (~(sourceOrOpFlags << 1)) & StreamOpFlag.INITIAL_OPS_VALUE;
    this.depth = 0;
    this.parallel = parallel;
}

构造方法二：构造用于追加一个中间操作到一个既有的 pipeline 上

断言，若传入的上游 pipeline 已被链接过消费，则抛出异常；

将上游 pipeline 标记为已消费；将上游 pipeline 的下游指向当前 pipeline；将当前 pipeline 的上游指向上游 pipeline；

配置操作属性；深度 +1

AbstractPipeline(Spliterator<?> source,
                     int sourceFlags, boolean parallel) {
    this.previousStage = null;
    this.sourceSpliterator = source;
    this.sourceStage = this;
    this.sourceOrOpFlags = sourceFlags & StreamOpFlag.STREAM_MASK;
    // The following is an optimization of:
    // StreamOpFlag.combineOpFlags(sourceOrOpFlags, StreamOpFlag.INITIAL_OPS_VALUE);
    this.combinedFlags = (~(sourceOrOpFlags << 1)) & StreamOpFlag.INITIAL_OPS_VALUE;
    this.depth = 0;
    this.parallel = parallel;
}

抽象方法

abstract Sink<E_IN> opWrapSink(int flags, Sink<E_OUT> sink)

说明文档

接收一个接收操作结果的 Sink，并返回一个接收当前操作的输入类型的元素并执行操作的 Sink，将结果传递到提供的 Sink 中
apiNote
实现类可能使用 flag 参数去优化 sink 的包装
例如，如果输入已经是 DISTINCT ，那么 distinct() 方法的实现只需要返回 sink

实现方法

wrapAndCopyInto

@Override
final <P_IN, S extends Sink<E_OUT>> S wrapAndCopyInto(S sink, Spliterator<P_IN> spliterator) {
    copyInto(wrapSink(Objects.requireNonNull(sink)), spliterator);
    return sink;
}

通过 wrapSink 方法获取最初的 sink
通过 copyInto 方法遍历元素
循例将执行到的 sink 返回，即使没什么意义

wrapSink

@Override
@SuppressWarnings("unchecked")
final <P_IN> Sink<P_IN> wrapSink(Sink<E_OUT> sink) {
    Objects.requireNonNull(sink);

    for ( @SuppressWarnings("rawtypes") AbstractPipeline p=AbstractPipeline.this; p.depth > 0; p=p.previousStage) {
        sink = p.opWrapSink(p.previousStage.combinedFlags, sink);
    }
    return (Sink<P_IN>) sink;
}

传入下一阶段的 sink，获取当前阶段的 sink，循环获取最初阶段的 sink

copyInto

@Override
final <P_IN> void copyInto(Sink<P_IN> wrappedSink, Spliterator<P_IN> spliterator) {
    Objects.requireNonNull(wrappedSink);

    if (!StreamOpFlag.SHORT_CIRCUIT.isKnown(getStreamAndOpFlags())) {
        wrappedSink.begin(spliterator.getExactSizeIfKnown());
        spliterator.forEachRemaining(wrappedSink);
        wrappedSink.end();
    }
    else {
        copyIntoWithCancel(wrappedSink, spliterator);
    }
}

判断是否有短路操作（filter 之类的中间操作）
遵循 Sink 中定义的操作顺序调用遍历方法，最终调用数据源的 tryAdvance方法

ReferencePipeline.Head

表示 ReferencePipeline 的源阶段

继承了 ReferencePipeline（二者在大部分属性的设定上是类似的，但存在一些属性是不同的，比如说 Head 的 previousStage 是空的，而 ReferencePipeline 则存在 previousStage，等等）

构造方法

本质上是调用的是 AbstractPipeline 的构造方法一，

ReferencePipeline(Supplier<? extends Spliterator<?>> source, int sourceFlags, boolean parallel) {
    super(source, sourceFlags, parallel);
}

ReferencePipeline(Spliterator<?> source, int sourceFlags, boolean parallel) {
    super(source, sourceFlags, parallel);
}

ReferencePipeline.StatelessOp

一个基类，针对一个流的无状态的中间阶段，同样集成了 ReferencePipeline

构造方法

本质上调用的是 AbstractPipeline 的构造方法二

StatelessOp(AbstractPipeline<?, E_IN, ?> upstream, int opFlags) {
    super(upstream, opFlags);
    assert upstream.getOutputShape() == inputShape;
}

posted @ 2019-09-16 23:36 飞蛇在水阅读(1830) 评论(0) 编辑收藏举报

刷新页面返回顶部

飞蛇在水

ReferencePipeline

公告